智能论文笔记

Reinforcement Learning with Non-Exponential Discounting

Matthias Schultheis , Constantin A. Rothkopf , Heinz Koeppl

分类：机器学习 | (统计)机器学习

2022-09-27

通常，在加固学习（RL）中，奖励会随着时间的流逝而使用指数函数来模拟时间偏好，从而限制了预期的长期奖励。相反，在经济学和心理学中，已经表明人类通常采用双曲线折现方案，当假定特定的任务终止时间分布时，这是最佳的。在这项工作中，我们提出了一种基于连续的基于模型的强化学习的理论，将其推广到任意折扣功能。该公式涵盖了存在非指数随机终止时间的情况。我们得出了表征最佳策略的汉密尔顿 - 雅各比 - 贝尔曼（HJB）方程，并描述了如何使用搭配方法来求解它，该方法使用深度学习进行函数近似。此外，我们展示了如何解决逆RL问题，其中人们试图恢复给定决策数据的折现功能的属性。我们在两个模拟问题上验证了我们提出的方法的适用性。我们的方法为分析在顺序决策任务中分析人类折现的道路开辟了道路。

translated by 谷歌翻译

Improving saliency models' predictions of the next fixation with humans' intrinsic cost of gaze shifts

Florian Kadner , Tobias Thomas , David Hoppe , Constantin A. Rothkopf

分类：计算机视觉

2022-07-09

图像区域的人类优先级可以以显着图或依次使用扫描模型进行时间不变的方式建模。但是，尽管两种类型的模型在几个基准和数据集上都稳步改善，但预测人类凝视仍然存在很大的差距。在这里，我们利用最近的两个发展来减少这一差距：理论分析建立一个原则性的框架，以预测下一个凝视目标和对凝视切换的人为成本的经验测量，而与图像内容无关。我们在顺序决策的框架中介绍了一种算法，该算法将任何静态显着性映射转换为一系列动态历史依赖的值映射序列，在每个注视转移之后都会重新计算。这些地图基于1）任意显着性模型提供的显着性图，2）最近测量的人类成本函数量化了眼动的大小和方向的偏好，以及3）连续探索奖金，随后的每次凝视随着每个探索而变化。该探索奖金的空间范围和时间衰减的参数是从人类凝视数据中估计的。这三个组件的相对贡献在MIT1003数据集上优化了NSS得分，并且足以显着超过NSS上的下一个注视目标的预测，并且在三个图像数据集中，对于五个最神经的显着性模型，对NSS的下一个凝视目标和AUC分数进行了预测。因此，我们提供了人类凝视偏好的实施，可用于改善任意显着性模型的“对人类对人类的预测”的下一个凝视目标。

translated by 谷歌翻译

Inferring perceptual decision making parameters from behavior in production and reproduction tasks

Nils Neupärtl , Constantin A. Rothkopf

分类：机器学习

2021-12-31

贝叶斯的行为模型在一系列心理物理任务中提供了计算级别解释。一个基本的实验范式是生产或再现任务，其中指示受试者生成再现先前感测的刺激幅度或实现目标响应的动作。因此，这种类型的任务将自己与其他心理物理任务区分开来，因为响应是连续性，并且努力在增加响应幅度下起着重要作用。基于贝叶斯决策理论，我们提出了一种推理方法来恢复感知的不确定性，响应变异性和潜在的人为反应的成本函数。至关重要，成本函数参数化，使得明确地包括努力。我们介绍了采用MCMC采样的混合推断方法，利用适当的提案分布和利用摊销推断与近似于最佳响应分布模式的神经网络的内部环路。我们展示了如何利用该模型来避免实验设计的不明确性，并且可以通过对实验数据的合成和应用验证来恢复参数。我们的方法将使行为科学家能够在生产和再生任务中执行决策参数的贝叶斯推断。

translated by 谷歌翻译

XAI Establishes a Common Ground Between Machine Learning and Causality

Matej Zečević , Devendra Singh Dhami , Constantin A. Rothkopf , Kristian Kersting

分类：机器学习

2021-10-05

最近的一些作品关于机器学习与因果关系之间的联系。在一个反向思考过程中，从因果模型中的心理模型的基础开始，我们加强了这些初始作品，结果表明XAI实质上要求机器学习学习与手头任务一致的因果关系。通过认识到人类的心理模型（HMM）如何自然地由Pearlian结构性因果模型（SCM）表示，我们通过构建线性SCM的示例度量空间来做出两个关键观察：首先，“真实”数据的概念 - 在SCM下是合理的，其次是，人类衍生的SCM的聚集可能指向“真实” SCM。在这些见解的含义中，我们以第三种观察结果认为，从HMM中得出的解释必须暗示在SCM框架中的解释性。在此直觉之后，我们使用这些首先建立的第一原则提出了原始推导，以揭示与给定SCM一致的人类可读解释方案，证明命名结构性因果解释（SCI）是合理的。进一步，我们从理论和经验上分析了这些SCI及其数学特性。我们证明，任何现有的图形诱导方法（GIM）实际上在科幻义中都是可以解释的。我们的第一个实验（E1）评估了这种基于GIM的SCI的质量。在（E2）中，我们观察到了我们对基于SCI学习的样本效率提高的猜想的证据。对于（e3），我们进行了一项研究（n = 22），并观察基于人类的SCI比GIM的SCI优势，从而证实了我们的初始假设。

translated by 谷歌翻译

Bayesian Classifier Fusion with an Explicit Model of Correlation

Susanne Trick , Constantin A. Rothkopf

分类：机器学习 | 人工智能 | (统计)机器学习

2021-06-03

将多个分类器或专家的输出组合成单个概率分类是机器学习中的基本任务，从分类器融合到专家意见汇集的广泛应用程序。在这里，我们基于新相关的Dirichlet分布，介绍了一个分层贝叶斯模型的概率分类器融合。该分布明确地模拟了边际Dirichlet分布的随机载体之间的正相关，从而允许基本分类器或专家之间的相关性建模。拟议的模型自然地容纳经典的独立意见池和其他独立的融合算法作为特殊情况。通过对合成和现实世界数据集的融合的不确定性和正确性来评估它。我们表明，由于不确定性降低，融合分类器的性能的变化即使对于高度相关的基础分类器，也可以是贝叶斯的最佳状态。

translated by 谷歌翻译

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

M-VADER: A Model for Diffusion with Multimodal Context

Samuel Weinbach , Marco Bellagente , Constantin Eichenberg , Andrew Dai , Robert Baldock , Souradeep Nanda , Björn Deiseroth , Koen Oostermeijer , Hannah Teufel , Andres Felipe Cruz-Salinas

分类：计算机视觉

2022-12-06

We introduce M-VADER: a diffusion model (DM) for image generation where the output can be specified using arbitrary combinations of images and text. We show how M-VADER enables the generation of images specified using combinations of image and text, and combinations of multiple images. Previously, a number of successful DM image generation algorithms have been introduced that make it possible to specify the output image using a text prompt. Inspired by the success of those models, and led by the notion that language was already developed to describe the elements of visual contexts that humans find most important, we introduce an embedding model closely related to a vision-language model. Specifically, we introduce the embedding model S-MAGMA: a 13 billion parameter multimodal decoder combining components from an autoregressive vision-language model MAGMA and biases finetuned for semantic search.

translated by 谷歌翻译

Hazard Analysis of Collaborative Automation Systems: A Two-layer Approach based on Supervisory Control and Simulation

Tom P. Huck , Yuvaraj Selvaraj , Constantin Cronrath , Christoph Ledermann , Martin Fabian , Bengt Lennartson , Torsten Kröger

分类：机器人

2022-09-26

安全关键系统通常在调试之前进行危害分析，以识别和分析操作过程中可能出现的潜在危险系统状态。当前，危害分析主要基于人类的推理，过去的经验以及清单和电子表格等简单工具。增加系统复杂性使这种方法非常合适。此外，由于高成本或身体缺陷的危险，基于测试的危害分析通常不适合。对此进行的补救措施是基于模型的危害分析方法，这些方法依赖于正式模型或模拟模型，每个模型都具有自己的好处和缺点。本文提出了一种两层方法，该方法使用正式方法与使用模拟的详细分析结合了详尽分析的好处。首先使用监督控制理论从系统的形式模型中合成了导致不安全状态的不安全行为。结果是输入到模拟的输入，在该模拟中，使用域特异性风险指标进行了详细的分析。尽管提出的方法通常适用，但本文证明了该方法对工业人类机器人协作系统的好处。

translated by 谷歌翻译

Memory-free Online Change-point Detection: A Novel Neural Network Approach

Zahra Atashgahi , Decebal Constantin Mocanu , Raymond Veldhuis , Mykola Pechenizkiy

分类：机器学习 | 人工智能

2022-07-08

检测数据分布突然变化的变更点检测（CPD）被认为是时间序列分析中最重要的任务之一。尽管关于离线CPD的文献广泛，但无监督的在线CPD仍面临主要挑战，包括可扩展性，超参数调整和学习限制。为了减轻其中一些挑战，在本文中，我们提出了一种新颖的深度学习方法，用于从多维时间序列中无监督的在线CPD，名为Adaptive LSTM-AUTOENOCODER变更点检测（ALACPD）。 ALACPD利用了基于LSTM-AutoEncoder的神经网络来执行无监督的在线CPD。它连续地适应了传入的样本，而无需保留先前接收的输入，因此没有内存。我们对几个实际时间序列的CPD基准进行了广泛的评估。我们表明，在时间序列细分的质量方面，ALACPD平均在最先进的CPD算法中排名第一，并且就估计更改点的准确性而言，它与表现最好。 ALACPD的实现可在Github \ footNote {\ url {https://github.com/zahraatashgahi/alacpd}}上在线获得。

translated by 谷歌翻译

Superposing Many Tickets into One: A Performance Booster for Sparse Neural Network Training

Lu Yin , Vlado Menkovski , Meng Fang , Tianjin Huang , Yulong Pei , Mykola Pechenizkiy , Decebal Constantin Mocanu , Shiwei Liu

分类：机器学习 | 人工智能

2022-05-30

关于稀疏神经网络训练（稀疏训练）的最新研究表明，通过从头开始训练本质上稀疏的神经网络可以实现绩效和效率之间的令人信服的权衡。现有的稀疏训练方法通常努力在一次跑步中找到最佳的稀疏子网，而无需涉及任何昂贵的密集或预训练步骤。例如，作为最突出的方向之一，动态稀疏训练（DST）能够通过在训练过程中迭代发展稀疏拓扑来实现竞争性训练的竞争性能。在本文中，我们认为最好分配有限的资源来创建多个低损失的稀疏子网并将其超级置于更强的基因，而不是完全分配所有资源以找到单个子网络。为了实现这一目标，需要两个Desiderata：（1）在一个培训过程中有效生产许多低损失的子网，即所谓的廉价门票，仅限于用于密集培训的标准培训时间；（2）将这些廉价的门票有效地超级为一个更强的子网，而无需超越约束参数预算。为了证实我们的猜想，我们提出了一种新颖的稀疏训练方法，称为\ textbf {sup-tickets}，可以在单个稀疏到较小的训练过程中同时满足上述两个desiderata。在CIFAR-10/100和Imagenet上的各种现代体系结构中，我们表明，SUP-Tickets与现有的稀疏训练方法无缝集成，并显示出一致的性能提高。

translated by 谷歌翻译